Jeros VIGAN

Projet- DataScience - Machine Learning

==========================================================

Modules de travail

==========================================================

===============================================================

Déclaration workspace

===============================================================

===============================================================

Importation des données

===============================================================

===============================================================

Vérification des données

===============================================================

1. Exploratory Data Analysis (EDA)

Objectif :

Analyse de la forme

Analyse de Fond :

Analyse plus détaillée

hypotheses nulle (H0):

===============================================================

Analyse de la forme des données

===============================================================

===============================================================

Analyse du fond

===============================================================

Visualisation initiale - Elimination des colonnes inutiles

Examen de la colonne target (variable à expliquer)

Histogramme des variables quantitatives continues

Diagramme en barres des variables qualitatives (Treemap)

Relation entre Target / Variables (quali quanti) & (quali quali)

Création de sous-ensembles positifs et négatifs

Création des ensembles Blood et viral

Target / Blood (quali * quanti / histogramme ou Boxplot)

 Relation Target / age

Relation Target / Viral (quali * quali / table de contingence)

Relations Taux Sanguin (quanti * quanti)

Relation Age / Sang

Relation entre Influenza et rapid test

Relation Viral / Sanguin

Création d'une nouvelle variable "est malade"

T-Test

PRE-PROCESSING

Création des sous-ensembles (suite au EDA)

nettoyage des données manquantes

TrainTest - Nettoyage - Encodage

TrainTest

Encodage (des variables qualitatives)

Nettoyage

Modellisation

Procédure d'évaluation

OPTIMISATION

Precision Recall Curve

24/08/2021